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PREFACE 


N écrivant ce fascicule je n’ai pas eu I’intention 
de composer un traité de statistique; j’ai voulu 
simplement réunir sous une forme aussi bréve 
que possible les éléments de la statistique indis- 
pensables a l'étude de l’astronomie stellaire et de 

quelques autres sciences expérimentales. 

L’étudiant qui n’a pas le temps de lire les beaux traités de 
Darmois et de Risser, par exemple, trouvera ici les quelques ren- 
seignements qui lui permettront d’aborder l'étude de l’astronomie 
stellaire, mais je ne saurais trop conseiller aux lecteurs la lecture 





de ces ouvrages. 


Henri MrIneur. 


ELEMENTS DE STATISTIQUE MATHEMATIQUE 
APPLICABLES A L’ETUDE DE L’ASTRONOMIE STELLAIRE 


La statistique, son caractére. 


La statistique a pour but d’étudier les phénoménes qui ne 
sont pas soumis a des lois fonctionnelles, et qui semblent done 
échapper au déterminisme. 

Prenons quelques exemples simples. 

Quelle relation y a-t-il entre le volume V d’une maison et le 
nombre N de ses habitants ? 

Nous savons fort bien que la relation entre N et V n’est pas 
une relation fonctionnelle, car des habitations de mémes dimen- 
sious peuvent étre habitées par des nombres différents de loca- 
taires. V n’est done pas déterminé lorsqu’on se donne N, et réci- 
proquement. On ne peut se borner a dire qu’un tel probléme n’est 
pas déterminé et le negliger en le mettant en dehors de la science. 
Nous avons en effet la notion trés nette qu’il existe entre V et N 
une « corrélation » pour employer dés maintenant le terme propre. 
Par exemple, nous savons que « statistiquement » les maisons de 
plus grand volume logent un plus grand nombre d’habitants. 

Quelle relation y a-t-il entre la taille des parents et celle des en- 
fants ? 

Nous savons que l’une n’est pas fonction de l’autre, mais nous 
savons aussi que, dans une race, la taille moyenne se maintient 
presque constante au cours des générations : I] est d’observation 
courante que certaines races humaines sont composées d’individus 
de taille plus grande que d’autres races. La taille s’est donc trans- 
mise par hérédité; nous concevons une corrélation entre la taille 
des parents et celle des enfants. 

Quelle relation y a-t-il entre le type spectral d’une étoile et son 
indice de coloration ? I n’y a pas de relation rigoureusement véri- 
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fiée entre ces deux éléments, mais, en moyenne, les étoiles des 
types avancés ont des indices de couleur plus élevés que les étoiles 
a hélium. 

La statistique a pour but |’étude de ces sortes de problémes. 

Avant d’exposer les méthodes de la statistique mathématique 
nous voulons montrer que les phénomenes soumis au déterminisme 
posent eux-mémes des problemes que seule la statistique peut 
aborder. Mais cela ne modifie pas le déterminisme auquel ces 
phénoménes obéissent, car leur indétermination n’est qu’une appa- 
rence due a l’imperfection de nos moyens d’observation et de 
connaissance. 

Par exemple il ne nous viendra pas a lidée que Vindice de 
coloration d’une étoile est un phénoméne qui échappe au deéter- 
minisme universel de la science. L’indice de couleur d’un astre 
n’est pas une fonction bien déterminée de son type spectral, cet 
indice dépend, en effet, non seulement du type spectral, mais 
aussi d’autres données qui échappent 4 notre connaissance, telles 
que le volume de |’étoile, sa masse, la densité et la température 
des diverses couches de sa chromosphere et de sa photosphere ..., 
toutes quantités que nos moyens d’observation ne nous donnent 
pas encore. 

De méme, si nous concevons le déterminisme biologique, nous 
sommes incapables de calculer la taille des enfants en fonction de 
celle de leurs parents, car le développement d’un étre vivant est un 
phénoméne encore plus complexe que le précédent et nous ne pour- 
rions prévoir son évolution, méme si on nous fournissait tous les 
éléments du probleme. 

Les méthodes statistiques interviennent partout ou notre con- 
naissance actuelle des phénoménes est insulfisante. 


Loi de répartition d’une variable aléatoire. — Considérons 
un nombre assez grand n d’objets de méme nature, par exemple, 
n étoiles du type spectral B, soit x une qualité de ces objets su- 
jette a la mesure et variant d’une fagon continue, par exemple, leur 
magnitude absolue, et 11, Vg, ..+-+ Un les valeurs de x pour ces n 
étoiles. On dit que x est une variable aléatoire. 

Si toutes les étoiles étaient identiques, on aurait : 


H OF] = L_g—= eeeee = TFIyn; 
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en réalité, cette circonstance n’est pas réalisée, et il est nécessaire 
: oe a ’ 
d’exprimer, au moyen de peu de nombres, les proprictés de l’en- 
semble x, %q, «---. a 

Soit x une valeur quelconque et @ une constante, désignons par 


} a a 
a¥ (x) le nombre de valeurs de x comprises entre .z— 7 et x + 3 


F (x) est appelé loi de répartition des valeurs de wx. 
Cette fonction semble dépendre de a, il faut ajouter a la défini- 
tion précédente que a@ doit étre choisi de maniére que le nombre 


. ° esl 4 . . 
de valeurs comprises dans |’intervalle «5 soit sensiblement pro- 


portionnel a «, si « est voisin de a. 

En pratique, on se contente de calculer F pour quelques valeurs 
dex: 

On forme une succession d’intervalles, par exemple : 


— pa..... — 2a, —a, 0, a, @a, ..... ARES dav ees 


et on compte le nombre de valeurs de x qui se trouvent dans l’in- 
tervalle pa, (p + 1) a; ce nombre est égal a : 


aF (p+ sal. 


On a done la valeur de F au milieu de chacun des intervalles 


/ 


formés. 
On représente graphiquement la loi de répartition en portant en 


abscisse les (2 +5) a, en ordonnées les F ((e + 3) a), et en- 


joignant ces points par une courbe continue, appelée courbe de ré- 
partition. 


On voit que le nombre de valeurs de x comprises entre deux 
limites } et b’ est donné par : 


ui ” F(x), 


C’est la surface comprise entre la courbe de répartition, l’axe 
des x et les ordonnées 6 et b’. 


Pour cette raison, on dit souvent que F (x) dx est le nombre de 


valeurs de la variable comprises dans V’intervalle .: + 5 de. 
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Exemple : Nous avons réuni les magnitudes absolues (1) de 
309 étoiles B, le tableau ci-dessous donne le nombre N de ces étoiles 


dont la magnitude absolue est comprise dans une succession d’in- 
tervalles d’amplitude 0,4. 


TABLEAU I, 









y= —4,0 —3,6 —3,2 —28 





Se hee 8G oe SCOR A | 0) 10:4) +-0,84- 18) 48 





ees ff ef | 
—— } ——____} —_____ | —..} | ———_ a 4 


—3.4 |—3,0 |_2,6 |—2,2 |—1,8 |—1.4 |—1,0 |—0,6 |—0,2 |4-0,2 |+.0,6 |+4,0 |+1,4 








La courbe de répartition est représentée sur la figure 1. 


Au lieu de F (z), on considére souvent la fonction : 


jiaym teen) 


appelée loi de probabilité de x. 





9 ” : 
~ 4, -3 -2 -1 0 +1 +7, ic 
Fic. 1. — Loi de distribution des magnitudes absolues des étoiles B. 

Asbeisses : Magnitudes absolues cz. ; 

Ordonnées : Nombre N d’étoiles dont la magnitude absolue est comprise entre 
x — 0,2 etx + 0,2. 

Les points représentent les valeurs fournies par l’observation ; la courbe continue 
est la loi de Gauss qui représente le mieux les données de l’observation. 


[ (x) dx est, en effet, la probabilité pour qu’une valeur prise au 





(1) La magnitude absolue d’une étoile est la magnitude qu’elle aurait pour un ob- 
servateur placé 4 la distance de 10 parsecs de cette toile ; c’est donc un caractere 


jntrinséque de létoile. 
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hasard parmi les n valeurs My, Mg, ...-. , M, soit comprise dans 
Vintervalle oe ar: 

Valeur moyenne. — La valeur moyenne de x est la moyenne 
arithmétique des n valeurs 2%, 9, --... , tn, on la désigne par x: 


C= 


Ceci peut s’écrire autrement : groupons dans la somme qui 
figure au second membre les valeurs de M qui se trouvent dans 
un méme intervalle : 


.. — pa, ..... —3a, —%a, — a, 0, ..... pa, (p+ 4t)a..... 


La somme s’écrit : 


+ 00 
_ 1 er 1 4 a 
mica ~ ) a? ee oa 3} 
Lv iE (p +5) | (p+3)4| 7 Uek (x), 
-o7 
ou encore : 

ue Ae 

os «zF (x) dz. 

Tis? on 


D’une maniére plus générale, la valeur moyenne d’une fonc- 
tion 9 (x) de la variable est définie par : 


a 00 
e@™=7Yem=s (x) F(x) dx. 
1 al | 


Par exemple, la valeur moyenne des magnitudes absolues des 
étoiles B étudiées précédemment est : 


XMN(M)_ —492,2 ia 


M= — — 0,68. 
= N (M) 309 





Changement de variable dans une loi de répartition. — Soit 
F(x) la loi de répartition d’une variable aléatoire x, la loi de 
répartition ® (wz) d’une variable wu définie par : 

x = 6(u). 
est donnée par : 
®(u) du = F (x) dz; 
c’est-a-dire : 


® (u) = F [6 (u)] 0’ (u). 
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Dispersion. Ecart moyen. — 1) est intéressant de savoir dans 
quelle mesure les x s’écartent de leur valeur moyenne x. 

Une valeur x; différe de x de R= e)— 2", quantité que l’on 
appelle son écart. 

L’écart est positif si.vj>.r, négatif dans le cas contraire, la va- 
leur moyenne des écarts est nulle et ne peut nous renseigner. Du 
reste, seule nous intéresse la valeur absolue des écarts et non 
leur signe. 

La moyenne de la valeur absolue des écarts n’est pas nulle, on 
Vappelle l’écart moyen : 


écarl moyen = | 2; — x]. 


De méme, les carrés des écarts sont positifs et leur valeur 
moyenne n’est pas nulle. 

On appelle dispersion des nombres .7; la quantité ¢ dont le 
carré est égal a la moyenne des carrés des écarts : 


ou : 


ot = at — (3) 


Les nombres x sont d’autant plus étroitement groupés autour 
de leur valeur moyenne que la dispersion est plus faible. 

Il est facile de voir, en effet, que le nombre des écarts dont la 
n 


valeur absolue dépasse ac, est inférieur a >) 


car, s'il n’en était pas 


. . 1 oagh > . Pa ‘ 
ainsi, la somme — ¥}(a— <x)” serait supérieure a o?. 
n 


Par exemple, les trois quarts des écarts sont inférieurs a 2c. 

Appliquons ceci a Vexemple des magnitudes absolues des 
étoiles B. 

Il est inutile de former tous les écarts et de calculer la somme 
de leurs carrés. Ecrivons en effet : 


=—\e 


(a; — 2)", 


Q 
2 
I 
=|— 
»—PMs 


et dans la somme, groupons ensemble les termes qui correspondent 
a des valeurs x comprises dans les intervalles —4,0, — 3,6, 


9 
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— 3,6, —3,2, ..... , la contribution apportée a la somme o? par 
les x situés dans le premier intervalle, par exemple, est a trés peu 
pres égale au nombre des valeurs de .x situées dans cet intervalle 
multiplié par 3,8. On forme donc la somme des produits des 
nombres d’étoiles de chaque intervalle par le carré de Pécart qui 
correspond au centre de l’intervalle. On trouve ainsi : 


———, 4 
=N (x) (2 + 0,6)? = 354 (x + 0,6)* = ed a4 44 == Gg, 


¢== 1,07. 


La moyenne 2% et la dispersion o s’appellent les caractéres de 
la loi de distribution. 

Loi de répartition de la somme de deux variables. — Consi- 
dérons deux variables aléatoires indépendantes x et y. 

Soient x,, Lo,.... Ln, n valeurs de x réparties suivant la loi F (xv) 
eb 1, Yous» Yn, n’ Valeurs de y réparties suivant la loi ® (y). 

Nous allons chercher la loi de distribution 4 (z) des n x n’ quan- 
tités : 


ee Eh ene 
Zipp HUE+Y:, k=4 2 n’ 


Le nombre des couples (x, y) pour lesquels x est dans l’inter- 
1 : 
valle x +5 ax et y dans lintervalle y = 5 dy est : 


F (x) ® (y) dxdy. 





Posons : 
z=2+y 
Oona: 
D (a, z) ee 
D(z, y) 


done la loi de répartition des couples x, z est : 
F (x) ® (z — a) dx dz 


la loi de distribution de z est donc : 


Bo CO 
ve= | F (z)®(z—x)dx ou 


— 0 


A+ os 
v= | _F@—y)®(y) dy. 
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Nous allons chercher les caractéres de cette loi. 

Propriétés des caractéres dune loi de distribution vis-a-vis de 
Vaddition. 

La moyenne Z, des 2;,, est : 





4 n n! 
7. = int aa x. (xi + Yx) 
As | n ( | n’ 
ae), r+ Ldn 
=n 2 reeks 
Jy =X + Yo- 


La valeur moyenne de z est done la somme des valeurs moyennes 
de x et de y. 

Réciproquement, étant donnée une variable z, fonction de deux 
variables aléatoires x et y indépendantes : 


z=f(z, y). 
On ne peut écrire dans tous les cas : 
z=f(#,y) 
que si f est une fonction linéaire de chacune des variables .v 


ety: 
z=ary+br+cy+d 


En d’autres termes, on ne peut dans une équation remplacer 
les variables aléatoires par leur moyenne que si cette équation est 


linéaire. 
Calculons la dispersion des z : 


2 
| 2 —~ (ay yo) | = (aj — Ly)® + (¥x—Yo)® + 2 (Li — Lo) (Yn — Yo): 


Prenons la moyenne de chaque membre : 


oa pavapntt Lena oie 
| 2 — (x) + y0) | =o2 + oF 
car ;: 
DX, (Li — Lo) (¥, — Yo) = Di (Li — Ly) X Zy (%n — Yo) = 9. 


La dispersion = des z est done donnée parla formule: 
LP = 0% +98. 
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= 


Ce résultat se généralise aisément : 

Si on considére n variables aléatoires : x, y.... #, dont les va- 
leurs moyennes sont 2%, Yo-+--- ,, et les dispersions ox, cy.+-.. ow, 
la somme x +y-+...-- + w, a pour valeur moyenne 2% -++ Y 
Sey w, et sa dispersion est donnée par : 


o® = dy* + o,® +0000 + cw?. 


Enoncé différent des résultats précédents. — Soient n 
nombres : 


Dg, lor anan gd 


F (x) leur loi de répartition, et f (2) = —- F (x) leur loi de pro- 


al = 


babilité : 

On dit que n’ nombres de la suite précédente sont pris au hasard 
si leur loi de probabilité est toujours f (x) ; leur loi de répartition 
est donc : 


/ 


n 


at f (ays = F(z). 


D’aprés cela la valeur moyenne et la dispersion d’un ensemble 
de nombres pris au hasard dans la suite .x,,.... @,, sont les mémes 
que pour cette suite. 

Le théoréme du paragraphe précédent peut s’énoncer ainsi : 

Considérons deux suites de n nombres : 


Ey. es okee x, loi de répartition F, de probabilité f 
‘Via Vesa ssnce Ve — ® _— ? 
et la suite: 
£; . 5; tie ene ss 
telle que: 
=U +Yi 


la loi de répartition des z; n’est pas définie par F et ®, car, pour 
définir entiérement la suite z;, il faudrait spécilier quel est le 
nombre y; de la seconde suite qu’on ajoute & chaque nombre 7; de 
la premiére. 


: ay ‘ X 
On dira que l’on ajoute les x; et les y; au hasard si les valeurs 
dey qui correspondent aux valeurs de x comprises dans l’inter- 


eve 
vallex + 5 dx, sont prises au hasard. 


Dans ce cas la loi de répartition des z; est facile a obtenir: 
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Il y a F(x) dx valeurs de wx dans Vintervalle x t5 dx, et parmi 


celles-ci il y en a une proportion 9 (y) dy auxquelles on ajoute des 
valeurs de y situées dans |’intervalle y > : dy. La loi de répartition 


des couples x, y, est donc : 
F(x) ¢(y) dady 


on a donc: 


et: 


Cet énoncé peut paraitre un peu abstrait, il s’éclairera par 
Vexemple de son application a la théorie des erreurs. 

Loi de Gauss. — Une fonction de fréquence F (x) est dite nor- 
male ou loi de Gauss si elle a la forme : 

siden 
(A) Biel ose 
oo Ix 

Il est facile de voir que si F a cette forme, x est la valeur 
moyenne de x et oy est la dispersion, ce qui justifie la notation 
adoptée. 

Pour le vérifier on utilise les formules classiques : 


fae i s.. +o, 
f le ie=o, [ € dt= yx 
: — © ° — @ 


et: 


On en déduit en posant : 


se 59/2 


o —(“£—Z,)* 
n Qa02 
———— e dxz=n. 
% | e 
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Le nombre total des valeurs de x est done bien zn. 
La valeur moyenne de a est: 


+00 — (x%&— 2%»)? 


iz 4 ge ar 
‘= — Tate me Chics 
i Fy/ Or | 





ro)" — (%#— £o)* 
r+ oc — (x — Lo) +o (2@— Lo 
rere ote PT Lo D502 Hig 
4 | bee Nie ames dx + aie} e de = Sy, 
Lv 2) 


—-——-. a Ta 
Jy V2x i Qn Re 


La dispersion ¢ est donnée par : 





ow —(z — Xo") 4 a oo a 
ot esatite (2 — Xy)*e aoe 0 ss.0,8 SS | Pe dl 
Sy Vn aes Vz : v4 
9,8 
donc : 
c= So 


On a usé et souvent abusé de la loi de Gauss en sciences expeé- 
rimentales. 

Il arrive souvent, en effet, que les lois de répartition que l’on 
rencontre en physique sont voisines d’une loi de Gauss; aussi les 
mathématiciens ont-ils cru longtemps que la loi de Gauss était un 
résultat expérimental et universel. 

Par contre, les physiciens ont souvent considéré la loi de Gauss 
comme un théoreéme de mathématiques, car celle-ci se rencontre 
dans de nombreuses questions de probabilité, comme l'étude du 
jeu de pile ou face. 

Au point de vue qui nous intéresse, la loi de Gauss ne doit étre 
utilisée comme un moyen que si elle est applicable au probléme 
étudié, mais rien a priori ne doit faire admettre qu’une loi de ré- 
partition inconnue est une loi de Gauss. 

L’oubli de cette remarque, pourtant si élémentaire, pourrait con- 
duire 4 des résultats sans valeur. 

Probléme. — Calculer la loi de Gauss, qui représente le mieux 
une fonction de fréquence donnée. 

Si la fonction de fréquence F (x) @une variable x est la loi de 
Gauss définie par la formule (1), %q est la valeur moyenne de x 


et o) est sa dispersion c. II suffit de calculer ces deux quantités 
et co et de poser dans la formule 1 : 


Ly =z, 
on, = 6, 


0 
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Si F (2) n’est pas une loi de Gauss, on adopte, comme loi de 
Gauss F, représentant le mieux F, celle quia les mémes caractéres. 

On calcule ensuite les valeurs de I’, (.c) et on les compare a celles 
de F (x). On peut juger ainsi si une fonction de fréquence est repré- 
sentable avec une approximation suffisante par uneloide Gauss. 

Reprenons l’exemple des magnitudes absolues des étoiles B: 
on avait : 

x= — 0,6, 10% 


La loi de Gauss qui représente le mieux la loi de fréquence de M 
est done : 
’ 309 +06" 
= 01x Jan. 2 x 1,073 ° 


Le calcul de F, ne présente pas de difficultés. Nous avons 
inscrit dans la 5° ligne du tableau { les valeurs de F,. La compa- 
raison de la 5¢ ligne (N caleulé) et la seconde (N observé) montre 
que la loi de répartition des x est & peu prés représentée par la 
loi de Gauss. (Voir également la figure 1.) 

Erreurs d’observation. — Jusqzici nous avons supposé que la 
variable x était déterminée avec exactitude par les observations. 
Nous allons maintenant introduire les erreurs d’observation. 

Nous laissons de cété les erreurs systématiques qui ne ressor- 
tissent pas des méthodes de la statistique, pour ne considérer que 
les erreurs accidentelles. 

Faisons n’ mesures d’une méme grandeur .vy par la méme mé- 
thode. Désignons par 2x{, %..... i, les n’ valeurs observées. On 
étudie les erreurs d’observation en cherchant la loi de distribution 
des x’. On adopte pour valeur la plus probable xv, de la variable, la 
moyenne des .v’ ; 


ry = ind ; 


la dispersion ¢ des x’ s’appelle alors l’erreur quadratique des 
mesures. 

c est une constante qui caractérise la méthode employée pour 
faire les mesures: nous supposons, en effet, que o est indépendant 
du nombre n’ des mesures effectuées. 

Cette quantité donne une évaiuation numérique de la précision 
de la méthode; cette derniére est d’autant plus exacte que la dis- 
persion ¢ des .x’ est plus petite. 
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Nous traiterons rapidement les divers probleémes qui se posent 
au sujet des erreurs d’observation; le lecteur qui voudrait appro- 
fondir le sujet se reportera aux traités spéciaux sur ces questions. 

Evaluation de la précision d'une méthode. — Pour évaluer la 
précision d’une méthode, il suffit de mesurer une méme quantité 
par cette méthode un grand nombre de fois et de calculer la dis- 
persion des nombres obtenus. 

Lorsqu’une erreur est répartie suivant une loi de Gauss de dis- 





persion o, erreur moyenne | «| est: 


le; = “\/- = 0,79796s. 
nm 


L’erreur probable E, c’est-a-dire la quantité telle que la proba- 





oak feb ; ne 
bilité de commettre une erreur inférieure a E, soit 7 est : 
E = 0,6745c. 


C’est erreur probable que l’on donne généralement dans les 
mémoires astronomiques. 

On peut remarquer que o est l’abscisse du point d’inflexion de la 
loi de distribution des erreurs. 

Nous avons dit qu’en pratique on adoptait, comme meilleure 
valeur d’une quantité la moyenne arithmétique des n valeurs 
mesurées, 

Nous allons chercher si on a intérét & augmenter le nombre n 
des mesures dont on doit prendre ensuite la moyenne. 

Précision de la moyenne de n mesures. — Pour étudier cette 
question, considérons un trés grand nombre N de mesures Xs, 
Wein x d’une quantité 2; supposons-les réparties suivant une 


loi de caractéres (x), «). Considérons tous les systémes de 
n nombres x tirés de la suite : 


n 
Nay Cesssce Ley (ity en ac’) 
N; 


pour chacun de ces systémes, formons la moyenne arithmétique y 
des n valeurs choisies. Par exemple : 


et cherchons la loi de distribution de ces C valeurs de y. 
N 
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Le probléme ainsi posé est un cas particulier de celui que nous 
avons traité a la page 12, les sommes telles que ny = 2, + 2 
+ 0+. +, Sont réparties suivant une Joi de caractéres : 


(nay, V/no?). 


Les moyennes y ont done pour valeur moyenne X, comme on 
pouvait s’y attendre, et pour dispersion : 


iy 


vn 

Ainsi, les valeurs moyennes, déduites de séries de n mesures 
faites par une méthode dont l’erreur quadratique moyenne est «, 
sont réparties suivant une loi dont la dispersion est : 


o = 


cS 
i 

En langage ordinaire, x mesures donnent une moyenne \/7 fois 
plus précise qu’une seule mesure; 100 mesures donnent un résultat 
dix fois plus précis qu’une seule. 

Poids. — On appelle poids d’une méthode ou d’un résultat 
obtenu par cette méthode, un nombre inversement proportionnel au 
carré de l’erreur quadratique du résultat. 

Si on prend 1 comme poids d’une seule mesure, le poids de la 
moyenne de x’ mesures est done 7. 

Probleme. — On fait N séries de mesures d’une méme quan- 
tité, qui donnent les résultats x,, r,..... tx; le poids de la iéme 
série est p;, quelle est la valeur la plus probable de x? Un cal- 
cul élémentaire donne : 


de plus, le poids de la valeur ainsi obtenue est p, + pg +..-. + Pn; 
cette formule ressemble a celle qui donne le centre de gravité 
de N masses et justifie le nom de poids donné a p. 

Etant donnée une loi de distribution, la corriger des erreurs 
observation. — Soit x une variable aléatoire et F, (x) dx sa loi 
de distribution. Soit x’ le résultat de l’observation et « lerreur, 
en sorte que : 

A ee 

Désignons par : 

IF (ar’) dar’ 
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la loi de distribution des valeurs observées et par g (e) de la loi de 
probabilité des erreurs. ce 

L’observation donne F et la vraie loi de distribution est F,. 
Comment évaluer F, lorsqu’on connait F et g? Nous suppose- 
rons que les x et les e s’ajoutent au hasard. 

La connaissance complete de g, loi de probabilité des erreurs, 
permettrait de déterminer Fy car : 


+0 
rey= fi Fy (a —«)g (0) de, 


équation intégrale d’ou on peut tirer F numériquement. 

Pour déterminer g, il suffit de mesurer un trés grand nombre 
de fois une méme valeur de x et de déduire de ces observations 
la loi de répartition des erreurs. 

En pratique, il arrive que < est trés petit et que le passage de 
F a F, se fait au moyen de petites corrections. 

Nous allons montrer quw’il suffit alors de connaitre non pas g, 
mais seulement e) — « et o2 = <2 (ou méme seulement < sie est 
négligeable) pour effectuer ces corrections. 

Si« reste petit, on peut écrire : 

dF, e dF, 


Be Oe BO) ee tar 


et équation qui donne F, s’écrit : 


dF, , a2d2P, 


F (x) = F, (x) — ¢y us + 3 Gp? 


dow: 


; ; F ; : 
F, (x)= F(x) + io F [s5%— ; |. 


Au lieu de chercher la loi de répartition F, on peut se proposer 
de chercher ses caractéres Hy etc. 
Comme : 


xv’ =2-+¢, 
soit « la dispersion vraie des x, 


les x’ et « la dispersion des err 
de démontrer : 


, 3 , ; 
s’ la dispersion observée pour 
eurs. D’aprés ce que nous venons 


x! = 2-465, o/? == gt a2, 
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Ainsi: o’)c, les erreurs d’observations ont pour effet d’étaler les 
courbes de répartition. 

Si on cherche les earactéres de la loi réelle de distribution d’une 
variable x, on détermine la valeur moyenne 2% et la dispersion o/ 
des valeurs observées, on détermine la moyenne des erreurs ¢ et 
leur dispersion « et on adopte pour valeur moyenne des x la 
valeur x’)—«< et pour dispersion réelle le nombre ¢ défini par : 


o? — o/2 —_ a, 


Reprenons l’exemple des magnitudes absolues des étoiles B. 
Nous avions trouvé : 
&=—0,62, 6’ == 4,07. 


Adoptons <== 0 et « 0,3 pour erreur quadratique d’une mesure 
de magnitude absolue. La dispersion réelle des magnitudes abso- 
lues des étoiles B est : 


o = V/o’? — af = 1,02. 


Loi de répartition de deux variables. — Considérons mainte- 
nant deux qualités d’un méme objet dont les mesures sont x et y 
et considérons une collection de » de ces objets. Nous allons étu- 
dier Ja distributiou des n couplescorrespondants : 


(74,}74), (hgs.¥e) owes 56s (X_> Yn)- 
Nous procéderons par yoie géométrique : 
Considérons deux axes rectangulaires ox, oy; représentons 
chaque couple de valeurs (x;, y;) par le point M; de coordon- 
<nées (2;, y;). Nous avons ainsi n points dont il faut étudier la dis- 
tribution dans le plan. Choisissons deux nombres a et 6 qui 
joueront le réle de a de la page 6. 
Soit M (x, y) un point quelconque, nous désignerons par 
a.b¥F (x, y) 
le nombre de points M; situés dans le rectangle de cdtés a et b 
paralléles aux axes qui a pour centre le point M . F (x, y) s’appelle 
la loi de répartition des variables x et y. 
Le nombre de points M; intérieurs 4 une courbe fermée C est : 


JS SFE (a, y) dady 
étendue a l’aire intérieure a C. 


Pour avoir les valeurs de cette fonction F en divers points du 
plan, on trace un quadrillage formé de paralléles 4 oy distantes 
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de a et de paralléles a ox distantes de 6; on compte dans chaque 
rectangle ainsi formé le nombre de points M; qui s’y trouvent et on 
Vinscrit dans le rectangle, il représente la valeur de F au centre du 
rectangle. On a ainsi une table commode de la fonction F, les 
rangées verticales sont appelées les colonnes, les rangees hori- 
zontales sont appelées les lignes. 

A titre d’exemple, nous avons étudié la loi de répartition des 
sous-types spectraux et des magnitudes absolues des étoiles B : 

Ces étoiles se classent en sous-types By, B,, By ... Bg, nous pre- 
nons comme variable y l’indice du sous-type spectral By, et 
comme variable x la magnitude absolue de M. 

La figure 2 représente la répartition des points x, y, on a porté y 
en abscisses et 2 en ordonnées. Le tableau II donne la loi de réparti- 
tion de x et y pour des valeurs dey de 1en1, et de xde 0,4en0,4. 

La loi de répartition des x considérés isolément s’en déduit de 
suite : adoptons pour former cette loi la méme division de i’axe or 
qui a servi pour former F(x, y), effectuons pour chacun des inter- 
valles ainsi formés la somme des nombres F inscrits dans la 
ligne correspondante, nous obtenons le nombre des 2; qui sont 
dans lintervalle. On procéde de méme pour y, on a ainsi vertica- 
lement une table de la loi de distribution de x, et horizontalement 
une table de celle de y. 

Analytiquement la loi de distribution de x par exemple est : 


+o 
J Fay) ay 
— 


Pour caractériser la loi de distribution des couples (.v, y), on 
étudiera d’abord la loi de distribution des x seuls. 

Nous désignerons par x la valeur moyenne, par ci la dispersion 
de x et par y eta, les quantités analogues relatives a y. 

Courbes de régression. — La loi de distribution des couples 
(x, y) peut servir a chercher a quel point les variables x et y sont 
liées. 

Considérons les points M situés dans une méme ligne du ta- 


ene aah 
bleau T, d’abscisse wx +5 a4, formons ly moyen de ces points et 


désignons-le par y (c), la courbe : 


y= y(z) 
s'appelle courbe de ré i 
s'app ourbe de régression en.r. 
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Si on se donne une valeur quelconque de .x, cette courbe donne 
la valeur moyenne correspondante de y. 
De méme la courbe de régression en y est définie par la valeur 


moyenne x(y) des x des points de la colonne y } : dy. 
Reprenonsl’exemple du paragraphe précédent : 


Voici pour les diverses valeurs de x la valeur moyenne de y : 


TaBLeau III 


— 3,8 |—3,4 | —3,0 |—2,6 |—2,2 |—1,8 |—1,4 |—1,0 |—0,6 |—1,2 |+0,2 |+0,6 +1,0 


0 





et pour diverses valeurs de y la valeur moyenne de wv. 


TaBLeau LV 


—1,97 | —1,30 


—1,55 | —4,30 





En général les deux courbes de régression sont distinctes. Plus 
elles sont rapprochées et plus la corrélation entre les variables x 
et y est étroite. 

De méme on peut pour chaque colonne calculer la dispersion 
c ,(x) des y, celle-ci dépend en général de x. On peut aussi calcu- 
ler la dispersion cy (y) des x correspondants a une valeur de y. 

Il importe de bien voir la nature de la corrélation entre deux 
variables x et y, 

S’il y avait entre x et y une relation fonctionnelle la donnée de x 
déterminerait celle de y. Ce n’est pas le cas actuellement. 

Si on connait une des variables, x par exemple, l’autre variable y 
n’est pas déterminée ; mais sa loi de distribution est détermi- 
née et dépend de wx, elle est donnée par les nombres de la ligne 
d’abscisse x. 

C’est cette dépendance entre x et la loi de distribution des y 
correspondants qui constitue la corrélation entre x et y. 
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Nous allons examiner quelques cas particuliers. 

Cas de deux variables statistiquement indépendantes. — On 
dit qwil y a indépendance statistique entre deux variables lorsque 
la donnée de l'une delles ne modifie pas la loi de répartition de 
l'autre. 

I] est facile de voir l’allure du tableau T dans ce cas: 

La loi de probabilité des y est indépendante de .x, elle est la 
méme dans toutes les colonnes si.x a été porté en abscisses, donc : 


y(x)=cle=y 
et 
5, (x) =cle = oy. 
De méme : 


z(y)=cle=a@ 
ox (y) == Cle ='¢a:. 


Les courbes de régression en x et y sont deux droites respecti- 
vement paralléles aux axes ov et oy. Ce sont deux courbes aussi 
distinctes que possible. De cette indépendance des lois de distri- 
bution de x et de y, tirons une conséquence qui généralise la pré- 
cedente et qui nous sera utile pour la suite : 

Soient 9 et J deux fonctions quelconques. La valeur moyenne de 
oz) ¥(y) pour tous les points M; est le produit de la valeur 
moyenne de 9(.v) par celle de y(y). 


2 (a) + (y) = 9 (@). Hy). 


Kn effet, dans la somme qui définit : (a) p(y) : 
eee eet 
(©) $(¥) = 5 Be (xi). v(ya) 


groupons les termes qui correspondent aux points d’une méme 
colonne ou ligne d’abscisse x contenant nz points, comme .x est 
le méme dans cette colonne nous pouvons mettre 9(.x) en facteur : 


ereeteana WR 
P@)YNH=TEe(@)=U ly). 
IN x col. x 
Or ah 


4 
—Z 
NZ col. ay 0”) 


est la valeur moyenne de ¥(y) correspondant a la colonne x, mais 


par hypothése, la loi de distribution des y de cette colonne est 
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indépendante de x, done cette valeur moyenne est égale a la valeur 
moyenne }{y) pour une colonne quelconque et pour l’ensemble des y, 
on peut mettre ce $(y) en facteur 


#@)- $0) =F) x % Ene (2) 


le second facteur représente g.x), le théoréme est done démontré. 
Par exemple dans le cas actuel : 


£.y—xz.y=0 ou (x—z)(y—y)=—0 


nous utiliserons ce résultat tout a lheure. 
On voit également que si x et y sont indépendants la loi de dis- 
tribution de (x, y) se décompose : 


N F(z,y)=N f(x) g(y) 


ou fest la loi de probabilité des .x et g celle des y. Nous avons 
rencontré ce cas page 10. 

Cas @une relation fonctionnelle linéaire. — Si x et y sont 
liés par une relation, et s’ils sont connus sans erreurs, les points M 
se placeront sur une courbe et seuls les rectangles du tableau T 
qui sont traversés par cette courbe contiendront des points M, les 
autres n’en contiendront pas. 

Supposons 2x et y liés par une relation linéaire : 


¥ = ax + B. 
Il est facile de voir que dans ce cas : 
(x — 2) (y —Y)= 9,4, 


on a, en effet : 
yo>ant+f et y—y=a(ce—2). 





Done : 
(x — ax) (y—y) =ac%. 
De plus : 
(y—y)?F= Aig a® (a — x)? = a2 o® 
Oy = F A0y 
Done : 


(a — 2) (y —y) = F oe oy. 
Réciproquement, supposons que l’on ait : 
(2—x)(y —y)= + Say Tye 


je dis que les x;, y; sont liés par une relation linéaire. 
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Retranchons des .x leur valeur moyenne «x et des y leur valeur 
moyenne 7, désignons encore par x et y les nouvelles variables 
ainsi obtenues. On aura : 


r=, Tye 


Elevons cette relation au carré et introduisons les définitions 
des quantités qui figurent dans cette équation : 


(La ¥i)t—Da*?. Dy? 
2 
développons 
Bx,” yi? + be Li Vi Ly Vu 
i 4; 
=r a;* yi? + = k (xi? y,? + 2,” yi?) 
i \t, k) 


x signifie qu’on fait la somme par rapport a tous les couples 
(#, kt) 


(z, 4) en considérant (z, #) et (, 7) comme identiques. 
La relation précédente s’écrit : 


y (ui %,— 2, Vi =, 


i,k) 
Ona donc : 
Li ¥, —%, Yi = 0, 
c’est-a-dire : 
at a. Fie 
eR Yn 


Les x et y sont done liés par une relation linéaire. 
Done si: 


(x—2)(y—y) =<, a,, 


les x et les y sont liés par une relation linéaire. 


Coefficient de corrélation. — Les deux exemples précédents 
nous conduisent a poser : 


> —(e&— «) (y—y) 


? 
Ga Fy 


rs’appelle coefficient de corrélation. 
Nous avons établi les résultats suivants : 
1° Si x et y sont indépendants, r —= 0; 
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2° Si w et y sont liés par une relation fonctionnelle linéaire 
fone tea eh 

Ce coefficient 7 donne donc une mesure dela corrélation entre les 
variables x et y. Silest petit, celles-ci sont a peu prés indépen- 
dantes, s’il est voisin de 4, la liaison entre les variables est trés 
étroite et presque linéaire. 

Revenons par exemple a |’étude statistique de l’indice spectral 
et de la magnitude absolue des étoiles B. Le coefficient de corré- 
lation est : 

r=-+ 0,72. 


I] importe de remarquer que si les deux variables sont liées par 
une relation non linéaire, le coefficient de corrélation est dilférent 
de + 1. 

Loi de répartition normale a deux variables. —- Une loi est 
dite normale ou loi de Gauss si elle a la forme : 


F (x.y)=N Vac — bF Fa (e—ay)* + 20 (a xo) (y— ye) + ¢ (Y — Yo) 
ce er Qr 


On vérifie que le nombre des couples x.y est bien N. 

On dit quelquefois dans ce cas que les points M sont répartis 
suivant une loi elliptique. En effet, les lieux d’égale densité des 
points M sont les ellipses concentriques et homothétiques d’equa- 
tions : 


a (x — £o)* + 2b (x — 2p) (Y — Yo) + ¢(¥ — Yo)® = Gonstante, 


et la densité décroit lorsqu’on s’éloigne du centre 7, yy de ces 
ellipses. 
L’eltipse : 
; a (x — xq) + 2b (x — aXe) (y — Yo) + €(Y — Yo)” = 4 


caractérise complétement la loi de répartition définie par la for- 
mule 4, on l’appelle ellipse de répartition des points M. 
La loi de distribution de x s’obtient en intégrant par rapport 
ay: 
Nie ee 
== —e i | 
@ (x) 3, WOR 26 


a 





ou : 
Veo 


C7 Sr -- 
ii Vac — b* 
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Ainsi .v est la valeur moyenne de 2, la dispersion est ¢,. La va- 


leur moyenne de y est Yo, sa dispersion est : 
Va 
+ = 
* SM a6—— be 
Le coefficient de corrélation 7 est donné par : 


+o-+4+o 


a SS ayf (xy) dxdy — fo 


0 seb foetal 


~ 


e’est-a-dire 





eo 
Vac 
Ces résultats sont résumés ci-dessous 
2= X ¥=No 
CRr As: eee ei 
* Jac—e ” Jac — Vac 
Réciproquement : 
a= : c= : 
~ o2 (4 — r?) = o (4 —r*) 
—ryr 4 
b= ——_—- BY eS ae en SE 
Gas, (4 — r*) yas oz02 (1 —r*)’ 
F peut done s’écrire : 
N 1 (a —a%)?__ 2r(w@—2X)(y—Yo)  (y—yo) 
F 2, y) = ———=e-a5[ — error aie My eae), 
( } WnsrFy v1 —r. 2(1—r*) oy SzFy 4 


Fixons la variable ., la loi de répartition des y correspondants 
est : 


e b ‘ 
F(y)=¢ (a). Yee 3 [W—vt oe —ao)] 
Viz ; 
La courbe de régression en x est donc la droite : 
b 
© dome hs 7 (t— %) = 0, 
et la dispersion des y autour de leur valeur moyenne : 


b, 
A Cea (2 — %0) 
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est: 


4 


a ait vi —r, 


De méme la courbe de régression en y est la droite : 
b 
C= Lo— Sh als 


On voit sur cet exemple que les deux droites de régression sont 
distinctes. Elles passent toutes par le point .r), yp, mais le coef- 
ficient angulaire de la droite de régression en .x est : 


= sy 


b 
a 


Celui de la droite de régression en y est : 


a 


Sy 
roy 

Ces coefficients angulaires sont distincts si 7 =~ 1. 

Remarque. — Si dans la loi de Gauss, 7 tend vers 1, la fone- 
tion F dégénere : 

Pour toutes les valeurs de x et y qui ne vérifient pas la relation : 

fey 
Y—%= = (@—%). 


x 


F tend vers 0. Au contraire, pour les valeurs qui vérifient cette 
relation, F tend vers : 


N __ (&@— 20)? 


—e 2c% 
ah Ir x 





Les points M sont donc tous concentrés sur une droite. 

Calcul de la loi-de Gauss qui représente le mieux une loi 
donnée. — 1 suffit, d’aprés ce qui précéde, de calculer XL, Y; Sr, 
sy, et r pour la loi considérée, le calcul dex, y, sz, oy se fait sans 
difficultés 4 l’aide de la derniére ligne et de la derniére colonne du 
tableau IT. 

Pour calculer 7, on forme la valeur de zy au centre de chaque 
rectangle de II, on la multiplie par le nombre inscrit dans ce rec- 
tangle, on fait la somme des produits ainsi obtenus pour tous les 
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rectangles, et on la divise par N. On obtient ainsi xy, on en dé- 
duit : 

ay —2.S, 

a Ono 


Ns 
y 


On peut encore écrire : 


oe ah See 


FpFy 


Une fois ces quantités connues on en déduit 2, Yo, a, b, c au 
moyen des formules précédemment établies. 
Les droites de régression sont alors : 


oy 
Y=Vtr—(« — a) 
Sn 
Sg 
L= ty + fi Waa ito): 
y 


Considérons par exemple l'étude statistique de l’indice spec- 
tral y et de la magnitude absolue x des étoiles B. Nous avons 
trouve : 


xr —=— 0,62 Yorn, 
Gp 1.07 o,—3,4 
et : 
r=-+ 0,72 


Les droites de régression sont donc : 


¥ = 2,08 x + 6,95 
xz =0,25 y — 2,05 


Les tableaux III et IV (3° ligne) et la figure 2 donnent les valeurs 
dey et de x (calculées). 

Répartition de trois variables. — On procede de la méme ma- 
niére que pour deux variables. Soient x, Y, 2 trois variables, on 
représente leur ensemble par le point M de espace de coordonnées 
“,y,%. On désigne par F (a, y, Z) le nombre de points M situés 
dans l’unité de volume entourant le point de coordonnées x, y, z. 
F est la loi de répartition des points M. 

La loi est normale si logF est une expression du second degré 
par rapport aux variables, 

Nous ne pousserons pas plus loin cet exposé, car nous serons 


amenes a revenir sur ces questions dans un autre fascicule a pro- 
pos des vitesses stellaires. 
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Représentation analytique d’une loi de répartition. 


On emploie ordinairement la loi de Gauss. Mais ilarrive qu’une 
loi de distribution observée est mal représentée par la loi de Gauss 
de mémes caractéres. On peut alors employer d’autres représenta- 
tions analytiques de la loi de distribution. Nous nous bornerons au 
cas ou on étudie une seule variable aléatoire. Les cas ou il y a plu- 
sieurs variables sont plus complexes ; nous traiterons dans les fas- 
cicules de cette série d’exposés ceux que nous rencontrerons au 
fur et 4 mesure de leur présentation. 

Avant d’exposer quelques-unes de ces représentations, disons 
que jusqu’ici elles n’ont guére eu d’applications bien profitables, 
il n’est pas toujours trés utile de représenter un phénoméne observé 
par une loi analytique, si on ne sait pas interpréter clairement 
les paramétres qui interviennent dans cette loi. 

Moments. — On appelle moment m, d’ordre p la moyenne 
de x?. 

+ 0 
i OK. 
m, = x2 =F J a F (x) da. 


—@D 
On considére souvent le moment d’ordre p dew — wx: 
Ly = (x7 — a). 


Le calcul de ces quantités se fait comme celui de o*. 
Si la loi de distribution de n valeurs est une loi de Gauss de 
caractéres (x, ¢) les moments ont pour valeurs : 


Yen 41— 9 
2p! 4, 
Yo, =sp—— oP 
Pt ee ee 


Les moments m s’en déduisent, par exemple : 


Mg = (&@— Ly + X)* = 9? + 2G 

m3 = (« — Xp)? + 3(@ — Xp)? Ly + 3aq? (H — Lo) + Lo" 
mz = 30°29 + XG. 

Mg = py + 60°r5 + 2}, 

Ms = By.4Ly + 100%x§ + 2}. 
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— 


Représentation d’une loi de distribution par une somme de 
deux lois de Gauss. — Supposons que n objets observés résultent 
du mélange de deux classes d’objets en nombre 7, et 7: 


Supposons que la variable aléatoire .v, attachée a chaque objet, 
soit répartie dans chacune des deux classes suivant une loi de 
Gauss. Soient (,, 2), (>, 9) les caractéres des deux lois de 
Gauss. 

La loi de distribution observée pour les n valeurs de .v sera : 


(a — @1)* Ng DE Sosa x2) 
e€ 202 . 


ny ee) aes) 
=e 20% =k 
o, V2n m4 oe V2n 








F(z)= 


La courbe y = F (x) pourra, suivant les cas, se présenter comme 
deux courbes normales bien distinctes, ou comme une courbe a 
deux maxima voisins de .v, et x, ou méme comme une courbe ¢ 
un seul maximum. 

On peut se proposer de calculer les valeurs des paramétres 7, 
Ny, Uy, 4, La, Sy qui permettent de représenter, de la meilleure 
maniére possible, la loi F (.c) observée au moyen d’une formule 
telle que la précédente : 


Considérons les 5 premiers moments et l’équation n= n, + ng: 


n= + Ng, 
NM, = Nyx, + Nee, 
NM, = Nxt + Ng + nyo} + 1933, 
NM = NL} + noes + 3n,x,0? + 3ngx,93, 
NM, = NL} + nyxy + Onyxiot + Gngx3s3 + 3nyot + 3g}, 
NM; = NL} + Ngvz + A0nyaxzo? + 10n x30} + A5nysjx, + 15ngsdz, 


On a ainsi 6 équations a 6 inconnues, il ne reste qu’a les ré- 
soudre. La solution compléte de ce systeme a été donnée par 
Pearson (4). 

Nous ne ferons qu’indiquer la marche du calcul et le résultat. 

On peut supposer l’origine placée a la valeur moyenne de x, en 
sorte que les m,; sont remplacés par les yj. 





(1) K. Pgarsow, Contributions to the Mathemati i 
kane ON, F tical Theory of Evolution. Philoso- 
phical Transactions of the R. S, of London, A. vol. 185, p. 81 et suiv., 1894. - 
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Désignons par : 
My be 


oo 2. = = 
A nr? 2 


les proportions des objets appartenant a chacune des deux classes. 
Les deux premiéres équations donnent : 


x 


2) a—— Xe = 4 
( 4 sae X, — Zy 


Ly — 2,’ 








En portant ces valeurs dans les troisiéme et quatriéme équa- 
tions, on déduit de celles-ci : 


oF 4 
f= 3 3 (Ly + Ly) Hy + LyLy, 
(3) . 
4 | 
t=m— 32% (©, + Le) Ly + LyLy. 


Enfin, en portant dans les cinquiéme et sixiéme équations, on a 
un systéme ou les inconnues sont x, et x. Posons : 


S= 21 + 2, P= 2,7y. 
Puis : 
(4) A, = 9p§ —3y,, A, = 30 pou, — 3s. 
Le systéme qui définit S et P se met sous la forme : 


Le 2 3 — 2 23A4P <a A, P? os 8 3 P3 
1“ P [43 — 1,P + 2P3| 
24P9 —282,P? + 36u2P§ — (245, — 1022) PS 
(6) — (148 uF, + 242) Pt + (288 yu} — 1224h5445 — 23) P* 
+ (24u32, — Tu2a%) P? + 32u4,P — 24ps = 0. 


(5) s 


En résumé, pour décomposer une loi de distribution en une 
somme de deux lois de Gauss, on effectue les opérations suivantes : 

4° On calcule la valeur moyenne de x, on y transporte l’origine. 
On calcule po, u3, 44, Hs, puls ), et A, par les formules (4) ; 

2° On résoud |’équation (6) qui donne P, l’équation (5) donne 
ensuite S et x,, ®,, centres des lois de Gauss, sont racines de : 


xz? —Srx+P=—0. 


3° Les équations (3) et (2) donnent les dispersions «, et og et les 
proportions a, et a, d’objets appartenant a chacune des deux 
classes. 


Dans la pratique de l’astronomie, la décomposition d’une loi de 
5 
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répartition en deux lois de Gauss n’a d’intérét que lorsque les 
deux courbes normales sont nettement séparées, par exemple, 
lorsque la loi de répartition obtenue présente deux maxima; dans 
tout autre cas, décomposer une loi observée en une somme de deux 
lois de Gauss, c’est faire l’hypothése, toujours dangereuse, que les 
deux lois de répartition considérées sont normales. 

Nous allons cependant traiter un cas particulier du probléme 
précédent qui se rencontre dans l’étude des mouvements stellaires 
et dont la solution est plus simple. 

Probléme : Représenter une loi de répartition connue par une 
somme de deux lois de Gauss de méme centre. 

Prenons ce centre commun comme origine, il s’agit de calculer 
Ny, Ng, 44, 9 de maniére qu’une fonction donnée numériquement 
F (x) soit représentée par l’expression : 





n x n x? 
F (2) = —tie—g32 4+ —2e- ss. 
alr ea a 
Considérons : 
+ +2 
My) = S F(z) M= YY |[aiF@) My= >» «#F(z) 
t= — © r= — @ z=—o@ 
YY 
Ms= Y |x 1F (2). 
t=—ow 
On a le systeme : 
M, eee Y ny Mt neg, 
M,= = [Nis + Nooo], 


Me = nyt + ngo3, 


2 
=2 /; [nyo + nyo]. 


on a deux équations, d’ou I’on tire : 


ei = 2MiMs ~— MoM; 
i tamy/3 t 


En éliminant x, et n,, 











3 M3 ~M Rt 
5 M?— M,M, 
T4Sq = = R 


2 
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Une fois.c,, «, obtenus, ona: 


r 
/5 M, — Mos, 


? 


y= 


"gr 8 
rt 
Ng = eres oer e 


Cette méthode de détermination de n,, ng, 6, co est préférable 
a celle qui consiste a utiliser les moments d’ordre 1, 2, 4 et 6, car 
cette derniére donne une importance trop considérable aux valeurs 
de F(x) pour les grandes valeurs de x, et une petite erreur sur 
F (.c) pour ces valeurs de la variable risque de fausser totalement 
le résultat. 

Développement de Charlier. — Posons : 


4 __ (&@— 0)? 
— AR F5, Yerel 
oV On : 





9 (x) = 


Charlier a proposé de représerter certaines lois de distribution 
par des expressions de la forme : 


F = No (xz) + Asp" (x) + Ayptv (x)..... 


les dérivés de g ont pour expression : 
— 3 ab 
gil (x) = | - Ae BS a Co) (x), 


an 4 — 2 
giv (x) = E =e fey (x Lp) a 5 |e (x). 


o6 


On désigne les quantités : 
s= wi par obliquité (skewness) 
et : 


A, ; 
by = a> Par exces (excess). 


Si ces coefficients sont nuls, F se réduit 4 une loi de Gauss; 
s’ils ne sont pas nuls, on a une loi de Gauss déformée : 

Si 8, est) 0 et 8, =0, le maximum de F est déplacé vers la droite 
et la courbe est allongée vers la gauche. 

Si 6, = 0 et @,)0, le maximum de F est plus aigu que celui de 9. 
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Si 8 —0 et B,(0, le contraire se produit et F peut méme avoir 


deux maxima. 
Le calcul des coefficients A; et de x, o se fait au moyen des 


moments : 


8 BEAK As 
$°~ — 6 No?’ 


8,= | 4-3 |. 


Fonction caractéristique d’une loi de répartition. 


Soit 2 une variable aléatoire, F(x) sa loi de répartition, on ap- 
pelle fonction caractéristique F—‘ (¢) la valeur moyenne de e“”. 


+ 00 
Fj = fi F (2) est de, 


Nous allons démontrer trois propriétés importantes de cette 
fonction caractéristique : 

I. La fonction caractéristique F—‘ définit la fonction de distri- 
bution F. 

L’équation a été résolue par rapport a F par Fourier : 


+ 0 
F(t et F -4(y) et dy. 
piers 


Si on connait F~‘(x), F(x) est déterminé par la formule précé- 
dente. 

II. Soient x et y deux variables aléatoires, F (x) et O(y) leurs lois 
de distribution, F~‘ et ®—! les fonctions caractéristiques corres- 
pondantes, la fonction caractéristique J! de la loi de distribu. 
tion } de la variable z= x + y est : 


p—4(t) = F-!1(t) x O-1 (Et). 


Nous allons démontrer ce théoréme. 


Il est nécessaire de préciser le sens exact de ce théoréme. On 


considére n valeurs By loses 2, de x et n’ valeurs YW» Yo 
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yn de y et on cherche la loi de répartition ~ des n.n! quan- 
tités : 


riety, oes FS eae n 


La loi de répartition des deux variables x et y est : 
F(x). O(y) 
car F(x) ®(y)dxdy représente bien le nombre total de sys- 


temes (2, y) pour lesquels x est dans l’intervalle x + 5 ax et y 


dans l’intervalle y + 5 dy. 


Nous avons montré page 10 que } (z) était exprimé par : 
$a fF @ oe —a)dz. 
Cherchons la fonction caractéristique de  : 
bY) =f" year ae 


et pour intégrer, revenons aux variables x et y : 
On aura : 


+ 
y-*(Q= ff" F@acnete +" dedy 


= [Face x [onetray = F-"(HO-*, 
C.Q. F. D. 


Le théoréme II est susceptible d'un énoncé 4 peine différent du 
précédent : 

Considérons deux variables aléatoires .x et y. Soit F la loi de 
répartition de n valeurs x, -tg,...-. In de x et ola loi de probabi- 
lité de y. 

A chaque valeur .r; de x, ajoutons une valeur y; de y et cher- 
chons la loi de répartition » (z) des n valeurs 2; = vit Yi 
en supposant qu’aux p= F (x) dx des valeurs de x situées dans 


Vintervalle*F 5 dx on ajoute p valeurs y;, yo-..-. yp de yprises au 


hasard et réparties suivant la loi p 9 (y). 
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On a dans ce cas: 


+ «0 
v= fi F (z —y) p(y) dy 


—o* 


ou encore, en désignant par / la loi de probabilité de x : 


-+-co 
$(z)=n S(z—y)¢(y) dy. 


La résolution de ces équations par rapport a F donne : 


b =F @x¢@ &) 

La seule différence avec la démonstration précédente est que 
dans cette démontration nous considérions nn’ valeurs x; + y obte- 
nues en ajoutant successivementtous les y, successivement a tous 
les x, alors que maintenant a chaque x nous ajoutons un seul y. 

Application a& une équation intégrale. — Supposons que les 
fonctions ® et » soient données et cherchons a définir une fonction 
F par la condition : 


; + 
va= fi F (x) @(z — x) da. 


—_-o 


Le calcul précédent montre que: 


—1 —1 —i 
» =F (t)x® (fb. 


Pour obtenir F on calculeradonc d’abord y-! et 1, puis F—! 
et enfin F par la formule. 





Le probléme que nous venons de résoudre est en somme le sui- 
vant: soient x et y deux variables aléatoires indépendantes; con- 
naissant les lois de répartition® et 4 des variables aléatoires y et 
2 -+ y, trouver la loi de répartition F de x. 

III. Si x et y sont deux variables aléatoires, F et ® leurs lois de 
répartition, 6 la loi de répartition de ensemble (x, y), © est-a- 
dire le nombre de valeurs soit de x, soit de y, soit de x et y 
comprises dans un intervalle donné, ona : 


6-1 — P-—1 + o-!, 
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Soient x, X..... t, les n valeurs de la variable aléatoire x, 
Ys» Ya--+-» Yn lesn’ valeurs de la variable y. 
Le nombre de valeurs de x et de y situées dans un inter- 


valle x + : dc est : 
0 (x) dx = [F (x) + O(z)] dz. 


D’aprés la définition de 6—‘, fonction caractéristique de 6 
ona: 
ca ee ee 
GiQ: F.D: 


Application. Stabilité de la loi de Gauss. —La fonction ca- 
ractéristique de la loi de répartition normale : 
— (%@ — Xo)? 
ELM mee 55 
F (a) =-—-__——— e 26 
F Vx 
est : 


—{ — (ott? 2 xoit) 
F (= N- ; 
Réciproquement si F—1 a cette forme, F est laloide Gauss. 
Considérons deux variables aléatoires x et y réparties toutes 
deux suivant des lois de Gauss : 





; N _(@=20)* 
F = —e 20% 
o V2r 
N —_(¥=vo)* 
® ( = —— @ 20/* 
‘Y) ote 


Soit Yla loi de répartition des NN’ valeurs x + y. La consi- 
dération de la fonction caractéristique donne immédiatement y. 


On a en effet: 


—i —i —i — ot? + 2ivol — of *t2 4 Ziyot 
¢ =F x® =Ne KEN“ 


donc : 


T — (0? + 0/2) 62 + Bi (0 + yo)t 
a) = NN’e 


et 


Bi Sy Des (ao + yo)]* 


N. NY 2 (o* + o/*) 


¥= Vatpe® Vin 


é 
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D’ot : 

Si x et y sont répartis suivant des loisde Gauss, il en est de 
méme dez =x + y. 

On retrouve également ce résultat que la valeur moyenne de zest 
Xp + Yo. et que la dispersion = de z est donnée par: 


>? = ao? + ot. 


Ce résultat s’appelle la stabilité de la loide Gauss vis-a-vis de 
addition. 
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